Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
Ra mắt mô hình AI Rinna Nhật Bản "Qwen2.5"
Generatived
4:45 14/2/25
Rinna (Shibuya-ku, Tokyo) thông báo rằng họ đã phát triển một mô hình tạo văn bản tiếng Nhật hiệu suất cao, sê-ri "Qwen2.5 Bakeneko 32B" và phát hành theo Giấy phép Apache-2.0. Cho đến nay, nó đã cung cấp các mô hình nền tảng như GPT và BERT, và đã ghi nhận 9,2 triệu lượt tải xuống và 1.200 lượt thích. Sê-ri mới này nhằm mục đích hỗ trợ nghiên cứu AI và phát triển tiếng Nhật.
Sê-ri "Qwen2.5 Bakeneko 32B" là phiên bản LLM "Qwen2.5 32B" của Alibaba đã trải qua quá trình học trước tiếng Nhật. Mô hình phái sinh "Qwen2.5 Bakeneko 32B Instruct" phù hợp để sử dụng ở định dạng tương tác và "DeepSeek R1 Distill Qwen2.5 Bakeneko 32B" cũng đã được phát triển bằng cách sử dụng đầu ra của DeepSeek R1. Những điều này được kỳ vọng sẽ góp phần tạo ra các mô hình ứng dụng có hiệu suất tiếng Nhật cao.
DeepSeek R1 Distill Qwen2.5 Bakeneko 32B đã cải thiện khả năng tư duy của người Nhật bằng cách chắt lọc kiến thức từ DeepSeek R1. Trong kết quả của MT-Bench Nhật Bản, nó đã đạt được sự cải thiện đáng kể về điểm số so với DeepSeek R1 Distill Qwen 32B, chủ yếu dành cho tiếng Anh và tiếng Trung. Kết quả điểm chuẩn chi tiết có thể được xem trên trang web chính thức.
Khi công nghệ tạo văn bản lan rộng với sự ra đời của ChatGPT, rinna nhấn mạnh tầm quan trọng của việc phát triển và vận hành các mô hình theo mục đích. Sử dụng kiến thức tích lũy được thông qua nghiên cứu, phát triển và vận hành bằng LLM, họ cung cấp một giải pháp tùy chỉnh có tên là "Tamashiru Custom". Họ có kế hoạch tiếp tục thúc đẩy việc triển khai AI trên phương diện xã hội và công bố kết quả nghiên cứu cũng như đưa chúng vào sản phẩm.
Chia sẻ bài viết này:

